iT邦幫忙

2022 iThome 鐵人賽

DAY 23
0
自我挑戰組

養爬蟲的人學爬蟲系列 第 23

【Day 23】不用帳號密碼也可以登錄Instagram嗎?(實戰Selenium 1/2)

  • 分享至 

  • xImage
  •  

閒聊
今天我們要繼續來爬蟲了!
這次要來挑戰爬取Instagram!/images/emoticon/emoticon08.gif

預期
不用輸入帳號密碼即可登錄。

實作
首先我們先用Selenium寫一個程式開啟Instagram網頁。

from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.instagram.com/')

會發現開啟網頁後,仍需要登錄後才能進入。
https://ithelp.ithome.com.tw/upload/images/20221006/20145359dc2Iz6jc3K.png

接下來我們可以先進到自己的Instagram登錄後,開啟cookies進行修改的擴充套件,將cookies匯出。
https://ithelp.ithome.com.tw/upload/images/20221006/20145359vhkrm3rOOm.jpg

然後我們將剛剛匯出的cookies貼到JSON檔上,可以只留下namevalue
再來將這個JSON檔用程式讀取,並且寫一個for-loop讓他跑就可以了!
這樣就可以成功進入了!
注意:這裡結尾需要加上refresh

from selenium import webdriver
from time import sleep
import json

if _name_ == '_mina_' :
    with open('cookies_jar.json') as f :
        cookies = json.load(f)
    dirver = webdriver.Chrome()
    dirver.get('https://www.instagram.com/')
    
    for cookie in cookies :
        driver.add_cookie(cookie)
    dirver.refresh
    

結語
今天順利的照著想要的進度走了!明天我們來模擬使用者對貼文案讚。

明天!
【Day 24】將所有貼文都點讚吧!(實戰Selenium 1/2)

參考資料
Instagramhttps://www.instagram.com/


上一篇
【Day 22】認識並實作哈希值(hashlib模組)
下一篇
【Day 24】將所有貼文都點讚吧!(實戰Selenium 1/2)
系列文
養爬蟲的人學爬蟲30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言